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Введение 

Разнообразие задач автоматической обработки естественно-языковых структур 
порождает многие актуальные на сегодняшний день вопросы. Как правило, это связано с 
неспособностью объективно описать субъективные состояния человеческого мезга [1-4]. 
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Обусловлено это, с одной стороны, недостаточно глубокими исследованиями по 
описанию процессов обработки естественно-языковой информации человеческим 
мозгом, а с другой — недостаточными формальными средствами для описания естест- 
венно-языковых отношений на морфологическом, синтаксическом и семантическом 
уровнях. Для целей лексикографии необходимо намного более тонкое описание лек- 
сических единиц, к определению которых необходимо привлекать лингвистические 
понятия, связанные со строением слов, приписыванием им значений определенных 
грамматических категорий, происхождением, понятиями значения и смысла, функцио- 
нированием в контексте и т.п. [5]. 

Важной задачей лексикографии является задача разметки словарей. Морфоло- 
гическая разметка словаря содержит и некоторую семантическую информацию (на- 
пример, признак «одушевленность» у существительных). Внедрение же семантической 
разметки значительно расширяет возможности лингвистов при использовании корпуса. 
Семантическая разметка дает возможность пользователю составлять содержательные 
запросы при поиске примеров употребления слова в определенном значении, а разра- 
ботчикам корпуса — создавать семантические фильтры для автоматического снятия 
неоднозначностей [6]. На пути ее осуществления одно из основных заданий — это 
построение классификаторов семантических структур. Например, в [4] обозначено 
четыре типа отношений, каждое из которых разбивается на подклассы: отношение се- 
монимии (синонимы, антонимы, паронимы, омонимы); отношение словообразования 
(слова с одинаковым корнем); тезаурусные отношения (род-вид, часть-целое, комплекс- 
элемент, причина-следствие); отношение ассоциаций и аналогий (ассоциаторы и 
аналогемы). 

Достаточно удачная семантическая классификация была произведена с по- 
мощью программы ПроСеКа [7], хотя, к сожалению, протестирована на достаточно 
узкой предметной области (сказки). В ней реализованы для пользователя возмож- 
ности задавать, редактировать и анализировать семантические отношения между лекси- 
ческими единицами в виде цепочек, элементы которых связаны отношением «толкуется 
через», сохранять эти данные в форме, ориентированной на компьютер. Другая, 
разработанная в этом направлении, программа «Построение Гиперцепочек» является 
автоматизированной, т.е. работа по построению может выполняться пользователем, 
непосредственно самой программой, или же предлагается комбинированный поиск. 
Кроме этого, программа позволяет строить цепочки и по отношению синонимии [8]. 
При построении программных средств неоднократно возникали вопросы, получение 
ответов на которые предполагало осуществление соответсвующей заданному слову 
формальной постановки задачи, нахождения метода поиска, основанного на разработан- 
ных правилах их определения, который скорректировал бы критерий окончания 
построения цепочек лексических единиц. Поэтому важно разработать математический 
инструментарий для построения цепочек лексических единиц, которые в свою оче- 
редь использовались бы для задач семанической классификации. 

Как правило, задачи, связанные с семантикой, имеют в большинстве своем дос- 
таточно обобщенный характер. Поэтому для построения соответствующих методов 
и моделей целесообразно использовать понятия и принципы достаточно высокого 
уровня абстракции. 

Дальнейшие исседования будут базироваться на понятиях и принципах от- 
дельных разделов математической логики, а именно на аппарате алгебры конечных 
предикатов. 
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Таким образом, целью данной работы является развитие средств моделиро- 
вания естественно-языковых объектов для классификации семантических структур путем 
формального описания построения цепочек лексических единиц, а именно иссле- 
дование внутренней структуры и-местных линейных логических преобразований и 
правил их вычисления. 


Постановка задачи исследования 


Вербальная постановка задачи была фактически приведена при анализе програм- 
мы «Построение Гиперцепочек». Таким образом был описан процесс нахождения 
цепочек лексических единиц. На рис. 1 графически представлена схема построения 
цепочек лексических единиц для любого естественного языка, где х — исходное 


слово, х|| — первое характерное слово из толкования (синонимов) слова Хх, Хи — 
И 
последнее характерное слово из толкования (синонимов) слова Хх, Х>1 — первое ха- 
И 
рактерное слово из толкования (синонимов) слова Х/|, Хо„ — последнее характерное 
1т 

слово из толкования (синонимов) слова Х||, Х›|1 — первое характерное слово из толко- 
[т 

вания (синонимов) слова Хи, Х 


Ч 
(синонимов) слова Мт и так далее. Под «характерным» понимаем слово из правой 


— последнее характерное слово из толкования 


части словарной статьи толкового словаря, которое непосредственно характеризи- 
рует исходную лексическую единицу, имеет то же концептуальное значение (вклю- 
чает такие же семантические компоненты). 


Таким образом, можно записать, что Хх; — это 7 -е характерное слово на 1-м 


уровне цепочки лексических единиц (номер лексической единицы, к которой отТНо- 
сится толкование, определяет верхний индекс слова), где Я — порядковый номер 


слов толкования (нахождения синонимов) лексической единицы. 


х 


пои И 12 12 12 
2 22 2" хх хр хп Е 


Рисунок 1 — Схема построения цепочки лексических единиц 


Ранее в работе [9] было приведено формальное описание построения цепочек 
лексических единиц с помощью теории линейных логических преобразований. При- 
менение метода нахождения и-о линейного логического преобразования и правил 
построения схем синтаксического подчинения позволило формализовать процесс 
выделения характерных слов толкования для автоматического построения цепочек 
лексических единиц. 
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В качестве лексической единицы было выбрано заголовочное слово левой части 
словарной статьи толкового словаря. 

Однако поскольку семантическая разметка направлена на усиление возмож- 
ностей поиска по лингвистическим параметрам, то представляет интерес, когда 
поиск в текстах ведется не только по отдельным словам, но и по их сочетаниям, т.е. 
конструкциям. Таким образом, исследование построения цепочек лексических единиц 
по словосочетанию является перспективной задачей. Поскольку сам процесс построе- 
ния формально был представлен как нахождение и-о линейного логического преобра- 
зования, то при построении цепочки по словосочетанию, состоящему, например, из 
трех слов, необходимо исследовать внутреннюю структуру трехместных линейных 
логических преобразований для определения правил их вычисления. 


Вычисление линейных логических преобразований 


В статье [10] приведено и доказано утверждение об общем виде линейных ло- 
гических преобразований на случай трех переменных. Рассмотрим обобщение этого 
утверждения на случай К переменных. 

Обобщение утверждения об общем виде линейного логического преобразования 
на случай А переменных. Для того, чтобы функция 


Е: РА хА,,х.хА > 1 
2 


ПА 


Г = ( х х...Х ) Й - 
де [Г Ах Ану х.-ЖАн и хВь а а была линейным логи 
Р "к 
ческим преобразованием, необходимо и достаточно, чтобы она имела вид 


[2 (Е) )= р а ы ИК хи о Хт, М р (, в (,, р „, ) (1) 
т1>7”и2...., пк 
для любого х) е Ау, где т. задан на Ай х А», х...Х А, х д, 
5 = Аи ХА, Х...Х Ам, . 


Доказательство. Достаточность. Пусть условие (1) выполнено. Тогда для любых 
Г, 1,12 Е Ат хА,ох.хАн, И любого а е {0/1} имеем 


(1 м [2 Ух! )= | Хи > Хту )= т (>, )^ Р, (>, Я Ри (=, = 


= У = й [5 Хи; › Хи» >. > Хи} > Я (., Хи > Хи у [2 (>, Хи» > Хи ))= 
= о от к Хто > Аир 1 и. (>, Хи Хи } 
У Кинь ом рт жи ноли, = [8 оо) 
Хи] ›Хио Хи Е 
для всех х) е 4. Аддитивность доказана. 
Теперь докажем однородность. 
[Е(Г)(х,)= У (к, Хи > Ху 1 хи, Хто Ат ))= 
Хи ›Хир ›-.>Хиу Е 
=а У (К ржи ножи, Ен Жи Жи, = [Е(Т)х). 


Хи >Хир ›--ЭХир Е 
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Необходимость. Пусть для всех Г, [1,12 Е Г АщхА хх И ЧЕ {0,1} выполнено 


(И уь)=()м (ть), 9 (о. = овЕ(Г). Для любого Ге ААЖА,) х.хл‚ Имеем 


Ци Хи» ЭХ, }- т (-, }р,, в р ( }- а [ И р“ © 


т т 


е Г | (, ) "из . и и (> ( , “т ы 


„> Е Аи) пе Ая, 

= У (р, (, р (,, ] й У (>, (, (, } ^...^ 
ан ЕАН, Лан, СИ ЕАН) 2712 Янь © т 

^ У [> (, } (,, } 
и, ЕАН, КОТ @ну ИЕ 


г. а 
при всех х„ © Ам, ‚Хи, © Ам,,...Хи, © Ам, , где ат (. )= 2 


ВИ а и а 
бои, (>, )= хи," бон, (=, )= хи, "К. Тогда 


Ч еАя, 
В Ст д. Чт) -ы Чи) = |” и р, (», | ты с, } И Что 27 Чт) хо) 5 


= У (7, С р (,, Ва („, Ка, Ср >> и ‚хи = 


Ст > ло >>, еАя ХА) х..Х Ав, 


= У |8 (<, у 5 вы („, хи, Хто Аир 3 }} 


Хи] >Хио >-->Хир Ам) ХА, Х..Х Аи, 


где положено К ьй Хи) >: Хту ‚м )= Е, ли хи ©) для всех 


Хи › Хи, >. Хи, © Аи Хх Ав, Х...Х Ам, ‚ ху е Аи. Утверждение доказано. 
Таким образом, мы рассмотрели преобразования из (хи,хк) в х/ и из 


а ) вх. 
Далее рассмотрим примеры вычисления линейных логических преобразований 


при задании ядра преобразования различными способами. 
В статье [10] представлены следующие примеры вычисления для случая трех 


переменных. 
Возникает вопрос — как не только записать, но и вычислить такие линейные 


логические преобразования? 
Запишем преобразование из (хиьхк) в х/ следующим образом: чтобы записать 


эту формулу в виде, удобном ДЛЯ вычислений, достаточно лишь выполнить опера- 
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цию переброски кванторов через предикат, не зависящий от переменной, стоящей 
под знаком квантора: 


В(хз ) = Эхо © (О(хо Хм ® ИК(м, хо хз )Р(я))). 
Рассмотрим пример вычисления линейного логического преобразования (рис. 2) 


по указанной выше формуле. Пусть К(х, хо, хз)= х@х0хб у хбхяха; Р(ом)=хЯ у хР; 


0(х2)= 9 ух; И={@,Б,с}- 

Тогда А(хз)= х4 м х$. 

Таким образом, правило вычисления линейного логического преобразования из 
(хи, хь) в х, по аналогии с формулой (аналог повторному интегралу) будет иметь вид 


[2 (р), = Зхь с Ак(Рь(хь ХЭх с А,К(хи,хььхи)Р, (хи), 
где А =А,=0. 


Рисунок 2 — Графическое представление 
линейного логического преобразования В(х;) 


Далее представим правило вычисления линейного логического преобразования 
ИЗ (Хи, ›Хи, ›.-> Хи, ] В Хх; следующей формулой: 


[Е(Р)х,)= Эх, ыы А | [5 5х», 1 ы Ап, 1 | 1 Я 1 | 
[Ви © Аа хи о и>и ДР и те А = Ар, == А = Ам =0. 


Мы рассмотрели простой случай, где все переменные преобразования определены 
на универсуме. Оказывается, при другом задании области определения, изменится и 
само правило вычисления. Рассмотрим далее пример (рис. 3), демонстрирующий 
этот факт. 
К'(з)= У Кох, ж)Р(я)О>)= Эх в ИЗх е О(Е(м,хо)^ 
№1 ,х2 ЕЕ 
^(К (51, хо, хз )Р( О ))) = 3х5 = И(О(х> ХАхо е ИЕ, хо )К (а, хо, хз)Р(м))) 


Зададимся областью Е(х|, хо)= хЯхЯ м хРхб. 


Тогда 
(хз) = Эхо е И(О(х> хо в К(м, хо )К (м, хо, хз )Р(м))) = Эхо с {а,Б,с} 


(уз ва, суебхвав у зай | ху хаха] (ка д |= 


= Эхо е сов, У в мхх8 [х5 м хо |= Эхо с {а,Б, сх У хаха =. 
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Рисунок 3 — Графическое представление линейного 
логического преобразования В'(хз) 
Таким образом, линейное логическое преобразование из (хиьхь) в х/ по об- 
ласти определения, заданной функцией ГР (ах ). можно вычислить по следующему 
правилу: 


[Е'(Е)) = м К(хи, хи „ми )Р(хи (хх ) = Эхи © ИЗхь в И(Е(хи, хр) ^ 


Хи,ХА ЕЁЕ(хи ху 
^(К(хиь ха ми) Раки РЕ ))) = Эх © О(РЕхь хи © ИЕ(хи,хк)) ^ 
^ К(хи,х, Хх р, (х» } 


Далее представим правило вычисления линейного логического преобразования 
из \Хи > Хи, ›-.›Хи, ] в х/ следующей формулой: 


' — 
[Е (1)(*,)= н Аки тиь еожир Жир 
Хи] ›Хио >. Хи ›Хир ЕЁ Хи] ›Хир > Хи Хи 
^Р, (хи р, и, } Ри (к, Ри (ки, = ы 
т Хи, Рио (Хи }- Ри Киру Ри (Хи, = хи, © Их,, е0..Ах„_ еОЗх„, ЕЦ 


Е\хи, ›Хи, ›- > Хи | ›Хи, АКАХи > Хир >> Хи | Хи > №1 РИ, (>, Ри, (,,, )^...^ 


^Р_| Хи, _| | ом = Эхи, Е ОВ: 5 На Е Е [а }^..^ 


^\Нхи, Е О\Ё\Хи, „Хи, Хи | Хи, Мк жи еж, зо 5 т (>, | 


Интерес представляет случай, когда х| е Е(х,х2) им еЕР№ (=, хо). Пусть 


Ат, хо) = Е(а,х2) = хр хЯ У хрхб, (их) = хх У хрх. 


В графическом виде представим соответствующее линейное логическое пре- 
образование на рис. 4. 


Формула для вычисления будет иметь следующий ВИД: 
А"(3)= у Кар, ж)Р@ Оо )= 


хеЕН №М,Х2 
№ ЕР 1х2 


= (Вх> е ОР (м1, хо м Эх! е ИВ (хо К, хо, хз (а Оо = 


| = Эхо ® ((О(х> {м е И(К(а, хо, хз ХЕ (1, хо )м Е (м, х2 Ра) 
огда 


В"(хз) = Эхо е а, с У х8 | а, ВЕ: У хазвх 


(ие кво (хаха дав (ка д |= Зоо в (а, сек у хх] 0. 
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Рисунок 4 — Графическое представление линейного 
логического преобразования "(хз 


Таким образом, линейное логическое преобразование из (хиьхь) в Х] по 


области определения, заданной функцией РК б хр), можно вычислить по следую- 
щему правилу: 
[Е )= Мо КОрхьхоР р) = 


ХиЕЁ,(ХиХк 
Хк ЕЁ» Хи›Хк 


= (3х% Е ОЕ (хи, хк)м Эхи = ОР (хи, хь Кик (хи Рь (хх ))= 
ых Эхк Е ОСБ, | Хх Е Ск» Хр›х1 ХЕ, (х„ ХА )\ Ер (хи к )Р, (х„ )))) 
Далее представим правило вычисления линейного логического преобразования 


иЗ Хи, ›Хи, ›.->Хи, ] В Хх; следующей формулой: 
[Е”(Р)(х,) — \/ К, Хи) >. Хи эн )^ 
я 1 ЕЁ Сб по Хр не) 
Хх, ЕЕ, Хи >Хпо ›- Хр >Х хи 
о ра а 
Хи, ЕЁ о 
АЕ т Ре, Ри Е е0Р,; о Хи) ›.. т. 
У Зхи, _ : еОЁ_ Хи, › Хи ›- Хи 1х К Хи) Хили, ]^ 
^® (=, )Р,, | а (. у 3 Эх, (р, (|, )^ 
^(х„_ ГЕИ Хи, ЭХ и, © И\К\хи, „Хи, ›-- Хи 1 >Хи, ]^ 
^ т Хи > Хи, > Хи ‚М > Хи > Хи > Хи, 1» Хи, М У 
УР АЕ и. а Хп» ›*. Уп) Ри } 5 }} 
Выводы 


Таким образом в статье был проведен анализ процесса построения цепочек 
лексических единиц. 

Для его формализации выбран аппарат алгебры конечных предикатов, а именно 
линейные логические преобразования. С помощью линейных логических преобразо- 
ваний было осуществлено математическое описание самого процесса построения. 
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Был проведен детальный анализ действий над линейными логическими преоб- 
разованиями. Исследовано на разных областях (когда области определения зависят 
от одной и/или двух переменных) вычисление линейных логических преобразований. 
Полученные правила вычисления линейных логических преобразований проил- 
люстрированы примерами для трех переменных. 

Перспективы дальнейших исследований. Как известно, основной структурной еди- 
ницей словаря служит словарная статья. Каждая словарная статья содержит регистровую 
единицу — заголовочное слово, которое является своеобразным идентификатором 
статьи. Разным заголовочным словам соответствуют разные словарные статьи. В свою 
очередь статьи с одним и более регистровым словом объединяют по тождественному 
набору лексических значений в регистровый ряд. Регистровыми единицами могут 
служить лексические единицы, образующие компоненты составных слов, слова, употре- 
бляемые только как компоненты установившихся словосочетаний [11]. Для исследова- 
ния внутренней структуры регистрового ряда можно использовать правила вычисления 
линейных логических преобразований. 

Что касается построения цепочек лексических единиц, то еще одну перспективную 
задачу, которую можно исследовать с помощью полученных нами правил, сфор- 
мулируем в следующем виде. Левая часть полноструктурированной словарной статьи 
содержит такие элементы: регистровый ряд; показатели словоизменительной пара- 
дигмы; показатели синтаксических связей и функций; грамматические параметры 
(род для существительных, вид для глаголов, показатель части речи, что указывается 
для местоимений, наречий, числительных, служебных частей речи и восклицаний); 
стилистические и другие ремарки. Таким образом, интересной и несомненно перспек- 
тивной для автоматической реализации является задача построения семантической 
цепочки по всей левой части словарной статьи, где будут учитываться разные 
задания областей определения для составляющих левой части словарной статьи на 
основе исследованных правил вычисления линейных логических преобразований. 
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КЕ5ОМЕ 
Г). Гесшгука, @.(. СйешлетКоу 


[лиеаг Гоэлса! Тгапзюгтанопя 15 т Ше б5етапйс Ма’Яия 
РгоЫет о} Тех 


[1 этуеп агае, а регзресйуе апа1у$1$ ОР зетапйс такте ргоет \уеге 4еуеореа 
[Ц тес ю атрИЯсаНоп оф геёлеуа| Геабагез Бу Ппои1$Яс сВагащетзис$. ТВе гефлеуа| 15 
теап7е4 по оу Бу \ога, Би Бу \ог4-сотЫпайоп 100. И 15 епузасше Киег 
еуеортеп{ ргоМет. 

Ап арргоасВ {0 Фе сопзегасНоп оЁ зетапйс сВаз юг рЬгазез \уаз деуеоре4 ЪБазе4 
оп Югпа|те4 ш [9] оЁ Фе ргосез$ оР Бато спаш$ о 1ех!са| ипИ$. Рог 5ае$ уаз 
зе]есе4 фе ипй оЁ Ше аоебга оЁ НпИе ргефсае$, пате]у бе Ппеаг 1о91с оЁ 
‘тапзКогтаНоп. Те Ппеаг 1051са| шапзюогтайоп Вере © сашгу ой а тафетайса] 
езсирНоп оЁ Пе ргосез$ оЁ сопзгасйоп. 

[ уаз сагле4 оц а деаПе4 апа[уз1$ оЁ Те асНоп$ ог Фе Ппеаг 1021с гапзКогтайоп$. 
А|[50 И уаз шуезизайе4 а са1сайоп ое Ппеаг 1о1са| гапзогтаНоп ш Чегет агеаз. 
ТБе гезипе сасщаНноп пез оЁ Ппеаг 1051с ЧапзЮптаНоп$ у’еге Шазиаея у 
ехатр/ез юг @гее уапаез. 
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